    20th Nordic Conference of Computational Linguistics (Nodalida 2015)

    Towards the Classification of the Finnish Internet Parsebank: Detecting Translations and Informality

    Abstract This paper presents the first results on detecting informality, machine and human translations in the Finnish Internet Parsebank, a project developing a large-scale, web-based corpus with full morphological and syntactic analyses. The paper aims at classifying the Parsebank according to these criteria, as well as studying the linguistic characteristics of the classes. The features used include both lexical and morpho-syntactic properties, such as syntactic n-grams. The results are practically applicable, with an AUC range of 85-85% for the human, ∼ 98% for the machine translated texts and 73% for the informal texts. While word-based classification performs well for the indomain experiments, delexicalized methods with morpho-syntactic features prove to be more tolerant to variation caused by genre or source language. In addition, the results show that the features used in the classification provide interesting pointers for further, more detailed studies on the linguistic characteristics of these texts

    CoNLL 2017 Shared Task : Multilingual Parsing from Raw Text to Universal Dependencies

    The Conference on Computational Natural Language Learning (CoNLL) features a shared task, in which participants train and test their learning systems on the same data sets. In 2017, one of two tasks was devoted to learning dependency parsers for a large number of languages, in a real world setting without any gold-standard annotation on input. All test sets followed a unified annotation scheme, namely that of Universal Dependencies. In this paper, we define the task and evaluation methodology, describe data preparation, report and analyze the main results, and provide a brief categorization of the different approaches of the participating systems.Peer reviewe

    Relatório de estágio em farmácia comunitária

    Relatório de estágio realizado no âmbito do Mestrado Integrado em Ciências Farmacêuticas, apresentado à Faculdade de Farmácia da Universidade de Coimbr

    Sydämessä laaja-alainen osaaminen : kirjaston rooli ja sen tarjoamat resurssit oppimisen tukena – esimerkkinä ohjelmointiopetus

    Opinnäytetyö käsittelee kirjaston roolia oppimisen ja opetuksen tukena peruskoulun ala-asteella, eli mitä tulee ottaa huomioon, kun suunnitellaan opetusta niin koulussa kuin kirjastossakin. Kysymystä lähestytään toteutetun esimerkkikoulutuksen kautta ja erityistä huomiota kiinnitetään mediakasvatuksen, monilukutaidon ja sosiokulttuurisen oppimisen käsitteiden pohdintaan ja niiden yhteenpunoutuneisuuden valottamiseen. Juuri monilukutaidon tukeminen, kehitys ja niihin liittyvä sosiokulttuurisen oppimisen aspekti toimii työn teoreettisena viitekehyksenä. Aluksi esitellään mediakasvatusta, moni- ja informaatiolukutaidon käsitteitä sekä sosiokulttuurista lähtökohtaa oppimiseen. Työ jatkuu taustoittamalla elokuussa 2016 voimaan tulleita peruskoulun opetussuunnitelman perusteita sekä ohjelmointiopetuksen roolia niissä. Lisäksi tutkitaan ohjelmoinnin opetusta muissa maissa ja arvioidaan tilannetta Suomeen verrattuna. Teoreettisen osion jälkeen avataan toteutetun koulutuksen suunnitteluprosessia sekä käytettyjä materiaaleja. Joulukuussa 2016 järjestetyn koulutuksen pilottiryhmänä toimi Liedon Ilmaristen yhtenäiskoulun luokka 4A. Koulutus kesti kolme oppituntia ja piti sisällään lyhyen, keskustelun muodossa toteutetun teoria- ja esittelyosuuden; aihepiiriin tutustuttavia, oppilaita aktivoivia harjoituksia, sekä lopuksi tablettitietokoneilla toteutetun varsinaisen ohjelmoinnin harjoittelun graafisessa käyttöympäristössä. Harjoittelu toteutettiin ScratchJr-sovellusta käyttäen. Koulutus vastasi koulun puolelta esiin noussutta tarvetta, ja osallistujat olivat siihen tyytyväisiä. Yksittäisestä tapauksesta on mahdotonta tehdä laajempia johtopäätöksiä, mutta esimerkkinä koulutus oli rohkaiseva ja tarjoaakin yhden toimivan mallin kirjaston tarjoamaksi uudeksi palveluksi: vastaavanlaista ohjelmointiopetusta voidaan järjestää paitsi koulun kanssa yhteistyössä, myös muille tahoille tarjottuna. Lopuksi työssä pohditaan laajemmin oppimista, laaja-alaista osaamista sekä koulun ja kirjaston rooleja tulevaisuuden aktiivisen kansalaisuuden kehittämisessä.This thesis explores the role of library in support of learning and instruction especially in the basic education: what needs to be taken into consideration, when planning instruction both in schools and in libraries? The question is approached from the point of view of an example training course implemented. The concepts of media education, multiliteracy and sociocultural learning, as well as their interconnectedness, are examined in depth. The theoretical framework for this thesis is formed upon these very ideas: supporting and developing multiliteracy and the related aspect of sociocultural learning. The first part introduces the aforementioned concepts of media education, multi and information literacies, as well as learning from the sociocultural premise. The text then proceeds to presenting the new basic education curricula, in force from August 2016 onwards. The role of programming education in the curricula both in Finland and elsewhere is explored and assessed. After these theoretical parts, the actual planning process of the organized training course and the materials used are explained. The training course, organized in December 2016, was piloted in Ilmarinen Comprehensive School in Lieto. The pilot group was class 4A. The training took three lessons and contained firstly a short introductory theory part, arranged in the form of discussion, secondly exercises aimed at activating the pupils and familiarizing them with the topic, and finally, the practical part where pupils did actual programming exercises using tablet computers and a graphical programming environment, ScratchJr. The school requested such a training course, and the participants were happy with the result. It is impossible to make broad conclusions based on this one case alone, but as an example, this was an inspiring experience, and does indeed offer one possible model for a new service organized by libraries: a programming training such as this can be organized not only in cooperation with schools, but also as something targeted at other institutions and groups. The final chapter of the thesis examines learning in a wider context, transversal competences, and the roles of both school and library in developing the active citizenship of the future

    Universal Dependencies 1.0

    Universal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and parsing research from a language typology perspective. The annotation scheme is based on (universal) Stanford dependencies (de Marneffe et al., 2006, 2008, 2014), Google universal part-of-speech tags (Petrov et al., 2012), and the Interset interlingua for morphosyntactic tagsets (Zeman, 2008)

    Universal Dependencies 1.1

    Universal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and parsing research from a language typology perspective. The annotation scheme is based on (universal) Stanford dependencies (de Marneffe et al., 2006, 2008, 2014), Google universal part-of-speech tags (Petrov et al., 2012), and the Interset interlingua for morphosyntactic tagsets (Zeman, 2008). This is the second release of UD Treebanks, Version 1.1